โมดูลแนะนำนี้ช่วยเชื่อมช่องว่างระหว่างอาร์เรย์อักขระที่ดิบและไม่มีโครงสร้างกับความเข้มงวดทางคณิตศาสตร์ของ ทฤษฎีภาษาอย่างเป็นทางการเราเปลี่ยนจาก การค้นหาแบบบังคับ—การตรวจสอบตัวอักษรทีละตัวอย่างละเอียด—ไปสู่ การระบุแบบอธิบายซึ่งเราได้กำหนดไวยากรณ์อย่างเป็นทางการเพื่อแสดงเซตที่ไม่จำกัดของข้อความที่ถูกต้อง
1. ธรรมชาติของความยุ่งเหยิงของข้อความ
ข้อมูลดิบโดยธรรมชาติมีลักษณะ "ยุ่งเหยิง" เพราะขาดโครงสร้าง มันเป็นเพียงลำดับของไบต์จนกว่าไวยากรณ์อย่างเป็นทางการจะจัดประเภทองค์ประกอบที่ประกอบขึ้นมา ในงานออกแบบโปรโตคอล การตรวจสอบความยุ่งเหยิงนี้คือแนวรับแรกในการป้องกันข้อมูลที่ผิดพลาด
2. แนวทางและเครื่องกลไก
Regex อาศัยอยู่บนพื้นฐานของ ลำดับชั้นของโชมสกีกฎเกณฑ์แบบปกติทำหน้าที่เป็นแบบร่างสำหรับการสร้าง เครื่องกลไกจำกัดแบบกำหนด (DFA)แทนที่จะเขียน if-else สายคำสั่งเพื่อค้นหาลักษณะเฉพาะ เราได้กำหนดว่าลักษณะนั้นคืออะไร คือซึ่งทำให้เครื่องมือประมวลผลสามารถจัดการตรรกะการเดินทางผ่านข้อมูลได้